Revisión de artículos: Profundizando la interpretabilidad y el pensamiento autónomo en modelos de lenguaje a gran escala
Artículo sobre investigación en IA de mayo de 2026. Detalla métodos de Anthropic para descifrar el pensamiento de Claude, el control de modelos basado en "geometría neuronal" de Goodfire AI y la re...